• 検索結果がありません。

心理学ワールド 90号 こころの測り方 統計モデリング 清水 裕士(関西学院大学) | 日本心理学会

N/A
N/A
Protected

Academic year: 2021

シェア "心理学ワールド 90号 こころの測り方 統計モデリング 清水 裕士(関西学院大学) | 日本心理学会"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

34

こころの

測り方

  近 年,久 保(2012) やLee & Wagenmakers(2013) な ど,統 計モデリングに関連する書籍が出 版され,「ベイズ統計モデリング」 という言葉が一気に注目を集めま した。統計モデリングとはどのよ うな方法を指すのでしょうか。本 記事では,その特徴や利点につい て解説します。 統計モデリングとは何か  松浦(2016)によれば,統計モ デリングとは「確率モデルをデー タに当てはめて現象の理解と予測 を促す営み」であるとしていま す。まず,確率モデルとは確率分 布を含んだ数理モデルを指しま す。たとえばデータに正規分布を 仮定した分散分析や回帰分析も, 確率モデルです。つまり統計モデ リングとは,確率分布を含んだ数 理モデルによって,現象の理解と 予測を行おうとするものだという ことができます。  しかし,統計モデリングをこの ように定義したとき,これまで心 理学で使われている分析手法でも 確率モデルを使っているのだか ら,何が違うのかがわかりにくい かもしれません。ここではこれま で心理学で使われてきた分散分析 や回帰分析などの「統計分析(便 宜的に本記事ではそう呼びます)」 と,「統計モデリング」の違いを 説明することで,統計モデリング とは何かを解説していきます。 従来の統計分析との違い  確率モデルを使う点では,統計 分析も統計モデリングも違いが ありません。しかし,統計分析で は確率モデルは固定して,母数に ついての仮説(たとえば母集団の 平均値差の有無)に注目します。 具体的には,t 検定では平均値の 差(正規分布の平均パラメータ μの差),相関分析では相関係数 (二変量正規分布の相関パラメー タρ)のように,確率モデルは決 まっていて,そのモデルに含まれ るパラメータの推定と有意性検定 の結果に関心があります。  一方で,統計モデリングは確率 モデルを分析者が選択あるいは作 成し,そのモデルがデータ生成を 説明・予測できているかを評価す ることに主眼があります。統計モ デリングの解説でよく紹介され る一般線形モデル(Generalized Linear Model:GLM)は,確率モ デルとして正規分布以外の確率 モデル,たとえば二項分布やガン マ分布など,幅広く選択できる手 法です。また,一般化線形混合モ デ ル(Generalized Linear Mixed Model:GLMM)では,パラメー タも確率モデルに組み入れること ができて,モデルの幅がさらに広 がります。このように決められた 確率モデルにデータをあてはめる のではなく,データに合わせて確 率モデルを選択するのが統計モデ リングの第一の特徴です。  統計モデリングのさらなる特 徴は,現象の理解をより深めるた めに,分析者が確率モデルを理論 に基づいて作ることにもありま す。このとき,線形モデルのよう な単純なモデルだけではなく,よ り複雑なパラメータの構造を確率 モデルに組み込むことで,現象を よりよく理解することが目指され ます。心理学の例ではありません が,たとえば新型コロナウイルス の感染者数の推定も,統計モデリ ングによって行われています。ウ イルスの感染の広がり方のメカニ ズムを疫学の知識に基づいて確率 モデルで記述し,その説明や予測 が上手くいっているかをデータか ら確認します。その過程で,もち ろんパラメータの解釈も行われま す。ただ,確率モデルがよりよく データを説明できているかの確認 のほうが重要です。  まとめると,統計分析手法は, 分析目的に合わせてすでにあるモ デルにデータをあてはめてパラ メータを推定することに主な関心 があり,統計モデリングはデータ 生成の理解や予測のためにモデル を作り,そのモデル自体を評価す ることに主な関心があるといえま す。このように,両者の違いは関 心の違いにあって,どの分析が統 計モデリングだといったように, 明確に線引きができない点には注 意が必要です。 統計モデリングの利点  統計モデリングの利点も,上記 の特徴から理解できます。  統計モデリングでは,データ生 成に合わせた確率モデルの選択や 作成によって,よりよい予測が可 能になります。たとえば反応時間 は多くの場合正規分布にはなら ず,歪んだ(対数正規分布や指数 正規分布に近い)分布になること が知られています。そのような データに正規分布を仮定した分散 分析を用いてパラメータ推定をし ても,正確な因果効果がわからな いかもしれません。またパラメー タの信頼区間についてはあまり違 いがないかもしれませんが,予測

統計モデリング

関西学院大学社会学部 教授

清水裕士

(しみず ひろし)

(2)

35 区間(モデルから予測されたデー タが発生しうる区間)となると大 きな違いが生じえます。データ生 成に合った確率モデルを用いるこ とで,予測が正確になることが期 待できます。  さらに,統計分析に比べると,よ り現象の理解の解像度が高くなる 利点があります。実験と分散分析 の組み合わせは,因果効果を知る のに適した手法です。しかし,い かなる理由でその行動の違いが生 起したかを記述するのには向いて いません。なぜなら,要因の操作 による行動の差がわかっても,その 背後のメカニズムはブラックボッ クスにならざるを得ないからです。 もし心理学の理論を適切に応用し た確率モデルを利用できれば,要 因の差がどの心理的特徴に影響し たのかがわかり,現象の理解につ いての解像度が高くなります。  たとえば,得られる報酬が遅延 するほど主観的価値が下がる現象 があります(遅延価値割引)。実 験計画法では,いますぐ1万円も らえる条件と1年後に1万円もら える条件で,前者のほうが選好さ れる確率が高いことを示すことが できますが,具体的に遅延にとも なってどのように価値が減るのか はわかりません。統計モデリング を使えば,遅延報酬の価値が減っ ていくメカニズムに数理的な説明 を与えることができます(たとえ ば指数割引モデル)。  ただ,実験計画法による因果推 論が不要になるわけではありませ ん。因果推論とメカニズムの探求 は科学研究においてどちらも不可 欠な営みであるため,双方の活用 が重要だと思います。 ベイズ統計モデリング  統計モデリングは,ベイズ統計 学とセットで説明されることが増 えてきました。いわゆる「ベイズ 統計モデリング」です。もともと 統計モデリングは,ベイズ統計学 でなければならないわけではあ りません。しかし,モデルのパラ メータを推定する方法としてベ イズ統計の推定法であるマルコ フ連鎖モンテカルロ法(Markov Chain Monte Carlo:MCMC) に さまざまなメリットがあったた め,統計モデリングもベイズ推定 によって解かれることが増えてき ました。  統計モデリングをMCMCで推 定することのメリットは,複雑な モデルが解きやすいことです。た とえばGLMで使える範囲の確率 分布であれば,最尤法でも全く問 題ありません。しかし,階層線形 モデルのように,データだけでは なくパラメータにも確率モデルを 仮定するような複雑なモデル(階 層モデルといいます)を推定す る場合は,MCMCのほうが解き やすいのです。加えて近年ではR やPythonに,確率モデルをその まま数式で書くだけでMCMCに よるパラメータ推定を可能にする パッケージ(rstanなど)が開発 されたこともあり,オリジナルな モデルを作ったときのパラメータ 推定の敷居が大きく下がりまし た。そのことも,統計モデリング でMCMCが使われる理由です。  それ以外にも,ベイズ統計学か ら統計モデリングを理解すること にメリットはあります。たとえば ベイズ統計学で仮説評価に使われ る指標としてベイズファクターが ありますが,これは統計モデリン グで使われるモデル比較指標であ るBICと本質的に同じです。また, 近年AICの発展版としてWAICが 提案され,統計モデリングで活用 されていますが,これもベイズ統 計学から生まれました。このよう に,統計モデリングとベイズ統計 学は密接に関わっています。 統計モデリングを使ってみる  統計モデリングを心理学の研究 で使ってみたい人も多いのではな いでしょうか。統計モデリングを 使うには,何を習得すればいいで しょうか。  まずはGLM,そしてGLMMを 習得しましょう。GLMMには正 規分布以外の確率分布と,階層モ デルを含んでおり,統計モデリ ングを理解する上で重要なエッ センスが詰まっています。また, MCMC で GLM や GLMM を 推 定する方法を解説した和書も多 くあります(久保, 2012;松浦, 2016)。ベイズ統計の習得もでき て一石二鳥です。  GLMMを習得したら,次に,先 行研究で作られたモデルを活用し てみるのがいいでしょう。認知モ デリングでは,認知的特徴をパラ メータとして取り出したりするた めの汎用的なモデルが多く提案さ れています。また近年では精神医 学や臨床心理学では強化学習モデ ルが,意思決定の分野では経済モ デルも,統計モデリングによる推 定がなされています。みなさんも ぜひ統計モデリングを使ってみて ください。 文 献 久保拓弥(2012)『データ解析のた めの統計モデリング入門:一般化 線形モデル・階層ベイズモデル・ MCMC』岩波書店

Lee, M. D., & Wagenmakers, E. -J. (2013). ʙayesian  coɡnitive  ⅿodeˡinɡ:  A  practicaˡ  course. C a m b r i d g e , U K : C a m b r i d g e University Press. 松 浦 健 太 郎(2016)『Stan とR で ベ イズ統計モデリング』共立出版 Profi le — 清水裕士 2008年,大阪大学大学院人間科 学研究科博士後期課程単位取得 退学。専門は社会心理学。著書 は『個人と集団のマルチレベル 分析』(ナカニシヤ出版)など。

参照

関連したドキュメント

諸君はこのような時代に大学に入学されました。4年間を本

にしたいか考える機会が設けられているものである。 「②とさっ子タウン」 (小学校 4 年 生~中学校 3 年生) 、 「④なごや★こども City」 (小学校 5 年生~高校 3 年生)

を軌道にのせることができた。最後の2年間 では,本学が他大学に比して遅々としていた

関ルイ子 (金沢大学医学部 6 年生) この皮疹 と持続する発熱ということから,私の頭には感

従って、こ こでは「嬉 しい」と「 楽しい」の 間にも差が あると考え られる。こ のような差 は語を区別 するために 決しておざ

ロボットは「心」を持つことができるのか 、 という問いに対する柴 しば 田 た 先生の考え方を

る、関与していることに伴う、または関与することとなる重大なリスクがある、と合理的に 判断される者を特定したリストを指します 51 。Entity

学校に行けない子どもたちの学習をどう保障す